Tidy data
from データの縦持ちと横持ち, データハンドリングと前処理
Tidy data
Hadley Wickhamの提唱したデータ形式
"tidy"=整然とした、というような意味。Tidy dataは「整然データ」などとも呼ばれる
以下の3つを満たすものがTidy dataであるとされる
Each variable is a column; each column is a variable.
(1つの列が1つの変数を表す)
Each observation is a row; each row is an observation.
(1つの行が1つの観測を表す)
Each value is a cell; each cell is a single value.
(1つのセルに1つの値のみが入る)
(文献によって若干表現は異なる。たとえば → 「Tidy」を共通言語にして、データサイエンス上のやり取りを簡素にしたい|Yasui)
参考
Tidy data(CRANで紹介されている)
Tidy Data | Journal of Statistical Software(上のページの元論文)
「Tidy」を共通言語にして、データサイエンス上のやり取りを簡素にしたい|Yasui(わかりやすい記事)